Skip to content
Built 26/04/15 21:42commit 9419fc3

中文 | English

Code Review 与 Test Time Compute —— Boris Cherny 的建议

这是 Boris Cherny(@bcherny)在 2026-03-10 分享的两条洞见总结。

1/ 引入 Code Review

Claude Code 新增了 Code Review:一组 agent 会对每个 PR 做深度审查。

  • 这个能力最初是先为 Anthropic 自己的团队构建的。随着每位工程师的代码产出提高,review 成了瓶颈。
  • Boris 已经用了几周,结论是它能发现许多原本不会注意到的真实 bug。
  • 当一个 PR 打开时,Claude 会派出多个 agent 去主动寻找问题。

2/ Test Time Compute 与多个上下文窗口

粗略来说,给编码问题投入的 token 越多,结果往往越好。Boris 把这称为 test time compute

  • 使用 彼此独立的上下文窗口 会让结果更好,这正是 subagents 有效的原因之一:一个 agent 可能制造 bug,另一个使用相同模型的 agent 却更容易把它找出来。
  • 这和工程团队很像:如果 Boris 自己写出了 bug,他的同事在 review 时代码反而更容易发现它。
  • 从极限上看,agent 也许终有一天会写出完美无 bug 的代码;在那之前,多个彼此不相关的上下文窗口 通常是更稳的做法。